ROZPRAWA DOKTORSKA 


Lokalne własności struktur losowych w 


teorii unikania wzorców 


Adam Gagol 
Uniwersytet Marii Curie-Skłodowskiej w Lublinie 
6 grudnia 2017 


Promotor: profesor Jarosław Grytczuk 


Promotor pomocniczy: doktor Jakub Kozik 


1 


Streszczenie 


Przedmiotem rozprawy doktorskiej są oszacowania na ilość kolorów 
w kolorowaniach unikających zadanego wzorca na grafach oraz słowach 
częściowych. W przypadku obu problemów wykorzystana jest metoda 
probabilistyczna oraz tak zwana kompresja entropii, czyli algorytmi- 
zacja Lokalnego Lematu Loväsza autorstwa Mosera i Tardosa. 

Pierwszym badanym zagadnieniem jest szacowanie minimalnej dłu- 
gości wzorca o k zmiennych pozwalającej na unikanie go nad alfabetem 
binarnym oraz ternarnym. Rozważany jest wariant problemu, w któ- 
rym słowo zawiera luki - miejsca, które na potrzeby dopasowywania 
wzorca mogą zastępować dowolną literę. Przedstawiony wynik poka- 
zuje oszacowanie równe oszacowaniu dla słów bez luk w przypadku 
wzorców o przynajmniej trzech zmiennych. 

Drugim poruszanym zagadnieniem jest szacowanie minimalnej dłu- 
gości list, dla których możliwe jest pokolorowanie drzewa o zadanej sze- 
rokości ścieżkowej bez powtórzeń, tj. unikając wzorca AA. Wraz z osza- 
cowaniem podany jest przykład klasy grafów o szerokości ścieżkowej 
2 nie będących drzewami, dla których nie istnieje wspólne skończone 


oszacowanie na długość list pozwalającą na uniknięcie powtórzeń. 
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1 Wstęp 


Niniejsza rozprawa poświęcona jest zastosowaniu metody probabilistycznej 
w dowodzeniu twierdzeń kombinatorycznych dotyczących unikania wzorców. 

Metoda probabilistyczna w kombinatoryce to szczególny sposób wyko- 
rzystania twierdzeń rachunku prawdopodobieństwa pozwalający dowodzić 
istnienie obiektów matematycznych spełniających określone właściwości. W 
swej podstawowej wersji zakłada konstrukcję odpowiedniej przestrzeni pro- 
babilistycznej i dowód, że losowo wybrany obiekt z tej przestrzeni z nie- 
zerowym prawdopodobieństwem posiada pożądane właściwości. Mimo że za 
pierwsze zastosowanie metody probabilistycznej uważa się zwykle pracę Szele 
dotyczącą cykli Hamiltona w turniejach z roku 1943 [24], jako głównego pre- 
kursora metody wymienia się zwykle Paula Erdósa, który prawdopodobnie 
jako pierwszy zdał sobie sprawę z jej ogólności i przez lata z powodzeniem 
stosował ją do różnorodnych problemów matematyki dyskretnej. 

Ważnym wynikiem metody probabilistycznej jest Lokalny Lemat Lovasza 
[19] pozwalający na dowodzenie istnienia struktur unikajacych zbioru lokal- 
nych własności. Istnieje wiele wersji lematu, historycznie pierwszą jest wersja 


symetryczna: 


Lemat 1.1. Niech Aj, Ao,..., A, bądą zdarzeniami o prawdopodobieństwie 
nie większym od p takimi, że kazde z nich jest całkowicie niezalezne od wszyst- 
kich innych z wyjątkiem co najwyżej d pozostałych zdarzeń. Wtedy jeśli ep(d+ 
1) <1, to z niezerowym prawdopodobieństwem żadne ze zdarzeń Aı, Ao,..., Ak 


mie zachodzi. 


Własność lokalna w tym kontekście to taka, której możliwe realizacje w 
obrębie struktury są od siebie niezależne z wyłączeniem ograniczonej liczby 
przypadków, t.j. spełniają restrykcje nałożone na zdarzenia A}, Ao,..., Ak W 


lemacie. 


Pośród wielu wersji lematu istnieje również wersja algorytmiczna, w której 
za pomocą prostego algorytmu typu Las Vegas konstruowany jest obiekt uni- 
kający wszystkich nieporządanych własności lokalnych. Algorytm działa przy 
założeniu, że wszystkie zdarzenia A są determinowane przez skończoną liczbę 
niezależnych zmiennych losowych P. W ogólnej postaci algorytm przedstawia 


się następująco: 


VpeP : Up <— losowa ewaluacja P 


while 3t takie, ze A, jest spełnione przez (v,)p do 
wybierz dowolne zachodzące zdarzenie Ay 
Vpevbl(At):vp <7 nowa losowa ewaluacja 


return (v,)p 


W pierwszym kroku algorytm przypisuje losowe wartości wszystkim zmie- 
nym losowym p € P. Następnie w głównej pętli losowo zmienia wartości 
zmiennych losowych składających się na zachodzące zdarzenia A aż do osią- 
gnięcia sytuacji, w której żadne ze zdarzeń nie zachodzi. Poza oczywistym 
atutem takiego podejścia, czyli bezpośredniej konstrukcji obiektów spełniają- 
cych dane zależności, pozwala ono rówież na poprawienie niektórych oszaco- 
wań wynikających z niealgorytmicznych wersji lematu. Jest to możliwe dzięki 
skorzystaniu z relacji między zmiennmi losowymi p a unikanymi zdarzeniami 
A, co wymyka się klasycznej wersji lematu. 

Dwa przedstawione w rozprawie wyniki dotyczące unikania wzorców w 
słowach (rozdział 2) oraz grafach (rozdział 3) istotnie korzystają z tej relacji 


oraz algorytmicznej wersji lematu. 


1.1 Oryginalne wyniki prezentowane w pracy 


Główną treścią rozprawy będą dowody dwóch twierdzeń dotyczących unika- 
nia wzorców. Twierdzenia bedą wypowiedziane z pełnym formalizmem ma- 
tematycznym w kolejnych rozdziałach, po wprowadzeniu odpowiednich defi- 
nicji, tutaj zostaną jedynie wstępnie zarysowane. Pierwsze twierdzenie jest 
wynikiem samodzielnej pracy autora [8] i dotyczy unikania wzorców (tj. ta- 
kich ciągów znaków, w których poszczególne podciągi mogą zostać przypisane 
kolejno po sobie występującym zmiennym we wzorcu) w słowach częściowych. 
Pojęcie *-unikalności występujące w wypowiedzi twierdzenia jest naturalnym 


rozszerzeniem unikalności na przypadek słów częściowych: 


Twierdzenie 1.2. Jeśli p jest wzorcem o m > 2 zmiennych takim, że |p| > 


2”, to p jest x-unikalny nad alfabetem ternarnym. 


Twierdzenie to przybliża pełną klasyfikację wzorców na takie, które są 
unikalne w słowach częściowych nad alfabetem binarnym, ternarnym i takie, 
które nie są unikalne nad żadnym skończonym alfabetem zostawiając problem 
otwartym jedynie dla trzech wzorców o dwóch zmiennych. 


Drugim prezentowanym wynikiem będzie dowód twierdzenia: 


Twierdzenie 1.3. Istnieje funkcja f taka, że jeśli T jest drzewem o szero- 


kości ścieżkowej w, to istnieje nierepetytywne kolorowanie T z list o długości 


fw). 


Razem z nim zaprezentowany będzie przykład klasy grafów o szerokości 
ścieżkowej 2, dla której nie istnieje skończone k takie, że każdy z grafów z tej 
klasy da się pokolorować z list długości k. Twierdzenie to zostało udowod- 
nione we współpracy z Jakubem Kozikiem, Piotrem Mickiem oraz Gwenaćlem 


Joretem [9]. 


1.2 Wprowadzenie do metod analitycznych 


Zanim przystąpimy do konstrukcji dowodów, przypomnimy klika podstawo- 
wych konceptów kombinatoryki analitycznej, dzięki którym uzyskamy póź- 
niej porządane oszacowania. Większość przedstawionych definicji i twierdzeń 
pochodzi z książki Philippe Flajoleta i Roberta Sedgewicka „Analytic combi- 
natorics” [10]. 

Ciąg liczbowy (a;);en jest wykładniczego rzędu K”, co zapiszemy w skrócie 


jako a, pa K”, wtedy i tylko wtedy gdy: 


lim sup Y|a,|=K. 


W dowodach użyjemy zdefiniowanych w książce operatorów działających 
na funkcjach tworzących SEQ oraz SEQ,. Pierwszy z nich odpowiada klasie 
obiektów 1+ E+ E? +... i reprezentuje ciągi elementów z E, tzn. pozycje 
nie są permutowane i istnieje dokładnie jeden ciąg pusty. Mamy: 

z 1 
EO, 
gdzie f jest funkcją tworzącą dla elementów z E. Operator SEQ; odpowiada 


SEQ(f(z)) = 1+Zn>1f(2)” 


klasie obiektów E* i reprezentuje ciągi o określonej długości, mamy zatem: 


SEQz(f(2)) = F(z)" 


Kombinatoryka analityczna bedzie uzywana w dowodach jako narzedzie 
służące do dowodzenia ograniczeń na wzrost współczynników funkcji tworza- 
cej f(z) zdefiniowanej równaniem typu f(z) = ż:9(f(2)). Będzie to możliwe 


dzięki zastosowaniu następującego twierdzenia: 


Twierdzenie 1.4. (/10], Proposition IV.5 ) Niech © będzie funkcją anali- 
tyczną w 0, mającą nieujemne współczynniki Taylora taką, że ó(0) 4 0. Po- 


nadto niech R < +œ będzie promieniem zbieżności ciągu reprezentującego © 


w 0. Wtedy przy zachowaniu warunku 


ról) 
"R. glo) >" 


istnieje jednoznacznie wyznaczone rozwiązanie T € (0, R) równania charak- 


terystycznego: 


ró(7) 
on) 


Ponadto formalne rozwiązanie f(z) równania f(z) = z :6(f(2)) jest anali- 


tyczne w 0, a jego współczynniki spełniają równanie wzrostu wyktadniczego: 


[2"| f(z) ba Oh poe 


2 Unikanie wzorców w słowach częściowych 


2.1 Podstawowe definicje 


Niech © = {a,b,c,...} oraz A = {A,B,C,...} będą alfabetami skończo- 
nymi. Elementy © nazywać będziemy literami, a ciągi elementów © słowami. 
Analogicznie elementy A nazywać będziemy zmiennymi, a ciągi tych elemen- 
tów - wzorcami. Symbolem %* oznaczamy zbiór wszystkich słów skończonych 
(niepustych) nad alfabetem ©. Podobnie At oznacza zbiór wszystkich niepu- 
stych skończonych wzorców. Oba te zbiory możemy traktować jako monoidy 
z operacją sklejania słów. 

Słowo w nad > realizuje wzorzec p jeśli istnieje niewymazujący morfizm 
h: At + Xt taki, że h(p) = w. Innymi słowy, jeśli istnieje podstawienie nie- 
pustych słów w miejsce zmiennych dające słowo w. Słowa realizujace wzorzec 
AA bedziemy nazywać powtórzeniami. 

Słowo w zawiera wzorzec p wtedy i tylko wtedy, gdy jakieś jego spójne 
podsłowo realizuje p. Słowo w unika wzorca p jeśli go nie zawiera. Na przy- 
kład aabaac zawiera wzorzec ABA, podczas gdy abaca unika wzorca AA. 
Wzorzec p nazywamy unikalnym jeśli istnieje nieskończenie wiele słów nad 
pewnym alfabetem skończonym unikających p (lub równoważnie, jeśli istnieje 
nieskończone słowo unikające p). 

Słowo częściowe nad alfabetem > to ciąg znaków z rozszerzonego alfabetu 
>, = UU {o}, gdzie o rozumiemy jako lukę reprezentującą nieznany znak. 
Dla słowa częściowego w zbiór pozycji luk oznaczamy jako H(w). Słowa, 
któte nie są częściowe, nazywać będziemy słowami pełnymi. Słowo częściowe 
zawiera wzorzec p jeśli istnieje podstawienie pojedynczych liter z © w miejsca 
H(w) takie, że słowo wynikowe zawiera p. W przeciwnym razie mówimy, że w 
unika p. Wzorzec p nazywamy *-unikalnym jeśli istnieje nieskończone słowo 
częściowe w nad >, unikające p oraz takie, że |H(w)| = oo. Dla przykładu, 


wzorzec AA jest unikalny nad alfabetem ternarnym, natomiast nie jest *- 
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unikalny nad żadnym alfabetem skończonym (bo możemy zawsze wstawić 
literę poprzedzającą lukę w tę lukę). 

Indeks unikalności A(p) dla wzorca p to rozmiar najmniejszego alfabetu > 
takiego, że istnieje słowo nieskończone nad > unikające p. Analogicznie indeks 
częściowej unikalności A*(p) to rozmiar najmniejszego alfabetu > takiego, ze 
istnieje nieskończone słowo częściowe w nad > unikające p oraz takie, ze 
|H(w)| = œ. 


2.2 Wprowadzenie 


Koncepcje i techniki związane z wzorcami w słowach znajdują zastosowa- 
nia w wielu dziedzinach teoretycznej i stosowanej informatyki. Algorytmy 
związane z rozpoznawaniem wzorców znajdują szerokie zastosowanie np. w 
genetyce lub biologii obliczeniowej [5]. Z drugiej strony, ciągi bez powtórzeń 
są często wykorzystywane do znajdowania kontrprzykładów w teorii języków 
bezkontekstowych, teorii grup, problemach kombinatorycznych na zbiorach 
częściowo uporządkowanych oraz dynamice symbolicznej [6]. 

Koncepcja unikalności i nieunikalności wzorców została wprowadzona przez 
Bean’a, Ehrenfeucht’a i McNulty’ego [2] oraz niezależnie przez Zimina [27]. 


Udowodnili oni jedno z podstawowych twierdzeń w tej tematyce: 


Twierdzenie 2.1. Niech p będzie wzorcem nad m zmiennymi. Wtedy p jest 
unikalny nad alfabetem pewnej skończonej wielkości k wtedy i tylko wtedy, 
gdy Wm unika p, gdzie Wm jest rekursywnie zdefiniowane jako wı = A, oraz 


w = wı-ı A Wwi-ı. 


Interesujacym i nietrywialnym wnioskiem z tego twierdzenia jest fakt, 
ze nieunikalność danego wzorca p jest rozstrzygalna, tj. istnieje algorytm, 
który w ograniczonym czasie jest w stanie zdecydować, czy dany wzorzec 
jest unikalny. Wciąż otwartym poozstaje problem rozstrzygalności o unikal- 


ność wzorca p nad alfabetem określonej wielkości k. Alternatywna wersją 
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tego problemu jest znalezienie minimalnego k takiego, że p jest unikalny nad 
alfabetem wielkości k (tj. znalezienie indeksu unikalności A(p)). W kontek- 
ście słów pełnych unikalność wzorców unarnych była badana przez Thue’go 
[25, 26]: A jest nieunikalny, A(AA) = 3, natomiast A(AAA) = 2. Przypadek 
m = 2 również został całkowicie sklasyfikowany [4, 18, 22, 23]. Wynik tej 


klasyfikacji można opisać następującym twierdzeniem [4]: 


Twierdzenie 2.2. Wzorce binarne pod względem unikalności dzielą się na 


następujące kategorie: 
1. Wzorce nieunikalne nad żadnym alfabetem: e, A, AB, ABA, 


2. Wzorce unialne nad alfabetem ternarnym ale nieunikalne nad alfabetem 
binarnym: A’, A? B, A? BA, A? B?, ABAB, AB?A, A? BA?, A?BAB, 


3. Wzorce unikalne nad alfabetem binarnym: reszta. 


W przypadku słów częściowych krótkie wzorce są niemożliwe do uniknięcia 
ze względu na możliwość podstawienia luki pod dowolną zmienną, przez co 
zarówno A jak i AA są trywialnie nieunikalne, natomiast A*(AAA) = 2 [20], 
tak samo jak w przypadku słów pełnych. W przypadku m = 2 również wi- 
dać odpowiedniość między słowami częściowymi a pełnymi - gdy zabroni się 
podstawiania pod zmienne pojedynczych liter, klasyfikacja wzorców dla słów 
pełnych pozostaje prawdziwa również w przypadku słów częściowych [3]. 

W ogólniejszej sytuacji, gdy wzorzec składa się z m zmiennych, hipo- 
teza Cassaigne’a dowiedziona przez Blanchet-Sadri i Woodhouse’a daje ści- 
słe ograniczenie na minimalną długość wzorca unikalnego nad binarnym i 


ternarnym alfabetem dla słów pełnych: 
Twierdzenie 2.3. Jeśli p jest wzorcem o m zmiennych, to: 


e Jeśli |p| > 3(271), to p jest unikalny nad alfabetem binarnym, 
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e Jeśli |p| > 2”, to p jest unikalny nad alfabetem ternarnym. 


Autorzy w pracy stawiają hipotezę mówiącą, że powyższy wynik dla słów 
binarnych powinien uogólniać się na słowa częściowe. W przypadku słów ter- 
narnych sytuacja jest nieco bardziej skomplikowana. Spostrzeżenie Kriegera 
i Ochema [17], że jeśli zmienna występuje we wzorcu tylko raz to można pod 
nią podstawić dowolnie długi ciąg liter i sprowadzić problem do wyszukiwania 
dwóch mniejszych wzorców pozwala sprowadzić problem unikalności dowol- 
nego wzorca do problemu unikalności wzorca zdublowanego, czyli takiego, 
w którym każda zmienna występuje conajmniej dwukrotnie. W przypadku 
wzorców ternarnych możliwa jest sytuacja, w której pojedynczo występujące 
zmienne dzielą wzorzec na podwzorce w taki sposób, że żaden z nich nie 
spełnia już równania z warunku Cassaigne’a. Przykładem może być wzorzec 
aafaayaa - jest on nieunikalny, gdyż do tego by słowo go zawierało wystar- 
czy, by para ao wystąpiła w słowie trzykrotnie dla pewnej litery a. Z tego 
względu w pewien sposób naturalne wydaje się rozważanie w przypadku alfa- 
betu ternarnego jedynie wzorców zdublowanych. Głównym wynikiem przed- 
stawianym w tym rozdziale będzie dowód hipotezy dla alfabetu ternarnego z 


pewnym ograniczeniem na m: 


Twierdzenie 2.4. Jeśli p jest wzorcem o m > 2 zmiennych takim, że |p| > 


2”, to p jest *-unikalny nad alfabetem ternarnym. 


Twierdzenie naturalnie uzupełnia przedstawioną wcześniej klasyfikację 
unikalnych wzorców w słowach częściowych pozostawiając jedynie niewielką 
lukę - wciąż nie jest wiadomo, czy istnieje zdublowany wzorzec długości 4 i 
o 2 zmiennych, który byłby nieunikalny dla słów częściowych nad alfabetem 
ternarnym. Takie wzorce są jedynie trzy - ABAB, ABBA oraz AABB, jed- 
nak sprawdzenie ich unikalności wymyka się używanym w tej pracy metodom 


probabilistycznym, których siła tkwi w zachowaniach asymptotycznych. 
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2.3 Dowód twierdzenia 2.4 


Dowód będzie wykorzystywać algorytmiczną wersję lokalnego lematu Loväsza 
autorstwa Mosera i Tardosa |21]. Koncepcja zastosowania tej wersji lematu w 
dowodach dotyczących wzorców w słowach pochodzi od Grytczuka, Kozika i 
Micka [12]. Polega na założeniu, że losowy algorytm budujący słowo unikając 
wzorca nigdy nie ułoży słowa pewnej długości M i użycia tego faktu do 


skompresowania ciągu bitów w stopniu większym niż jest to możliwe. 


Dowód. Ustalmy wzorzec p o długości 2" i k > 3 zmiennych. Udowodnimy, ze 
możliwe jest skonstruowanie słowa W = w;... w, nad alfabetem © = {a,b,c} 
unikającego p i takiego, że H(W) = {w; : 100 | i}. Przeanalizujmy randomi- 
zowany algorytm 1, który stara się losowo ułożyć słowo W (dla uproszczenia 
analizy zakładamy, że umieszcza on litery również w miejscach luk) i wycofuje 


wszystkie instancje wzorca p traktując pozycje H(W) jako luki. 


Algorithm 1: Unikanie wzorca p 
wejście: C:N— X = {a,b,c} 
i-1lj-l 
while j < n do 
w; 4) 
att 
j++ 
7 if Istnieje instancja R wzorca p kończąca się na w; then 
Niech W; będzie zbiorem pozycji R 
for k € Wr do 


usuń literę na pozycji wy 


j <— pierwsza pozycja w WR 


return W 
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Załóżmy nie wprost, że nie istnieje n—literowe słowo unikające p, a za- 
tem algorytm nigdy się nie zatrzyma. Ustalmy pewną wejściową sekwencję 
C i prześledźmy pierwsze M kroków działania algorytmu. Działając algo- 
rytmem na sekwencji C stworzymy strukturę dokładnie opisującą zacho- 
wanie algorytmu. Struktura ta będzie zależeć jedynie od sekwencji C oraz 
wzorca p. Ponadto z konstrukcji będzie wynikać, że dla dwóch róznych se- 
kwencji C i C” otrzymamy różne struktury. Naszą strukturą będzie piątka 
(P,L,S,H,F) € (P, L,S, H, F), gdzie: 


1. P=(pm,...,pm) jest ciągiem liczb, gdzie p; jest różnicą w ilości liter, 
z których składa się konstruowane słowo po i-tym i (i — 1)-ym kroku 
algorytmu (zatem p, < 0 w przypadku wycofania instancji wzorca oraz 


pi = 1 w przeciwnym wypadku), 


2. L= (Lı,..., Ls) jest ciągiem zbiorów liczb, gdzie L; = £b;4,..., lix-ı} 
(k jest ilością zmiennych we wzorcu p), al; ; jest liczbą liter przyporzad- 
kowanych do j-tej zmiennej w i-tym wycofanym powtórzeniu wzorca 
p podczas działania algorytmu. Liczba liter przyporządkowanych do k 
- tej zmiennej nie musi być dodatkowo zapisywana, gdyż będzie moż- 
liwa do odtworzenia na podstawie pozostałych zmiennych i długości 


wycofanego fragmentu. 


3. S =(s1,...,s,) jest ciągiem powstałym z liter przyporzadkowanych do 
poszczególnych zmiennych a, 8, y kolejnych wycofywanych instancji p. 
Zapisywane są litery, które są przyporządkowane do danej zmiennej w 
miejscu nie zajętym przez lukę. W przypadku, gdy pewna pozycja danej 
zmiennej jest zajmowana przez lukę w każdej instancji tej zmiennej, w 


miejscu tej pozycji zostaje zapisana dowolna litera. 


4. H =fh,...,hijpj) jest ciągiem liter koniecznych do odtworzenia liter 


przyporządkowanych lukom podczas działania algorytmu. Po każdej 
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retrakcji do H dodawane jest tyle liter, ile luk znajdowało się w wy- 
cofywanym fragmencie. Jest pewna redundancja między H i S, ale nie 


jest ona asymptotycznie istotna. 


5.F=(fh,..., fw) (gdzie n’ < n) jest sekwencją liter w słowie W po M 
krokach algorytmu. 


Bezstratność kompresji. Dowiedziemy, że możliwe jest zrekonstruowa- 
nie pierwszych M elementów sekwencji wejściowej C na podstawie piątki 
(P,L,S, H, F) powstałej w trakcie M kroków algorytmu. Dowód będzie po- 
legal na odtworzeniu z (P, L, S, H, F) elementu C(M) oraz (P', L’, S’, H’, F’) 
- piątki powstałej w trakcie pierwszych M — 1 kroków działania algorytmu. 
Iterując ten proces otrzymamy całą sekwencję C. 

Jeśli py = 1, to żaden wzorzec nie został wycofany podczas ostatniego 
kroku algorytmu, więc C(M) jest po prostu ostatnim elementem F, P’ oraz 
F” są o jeden element krótsze, natomiast L' = Li H' = H. 

Jeśli py = 1 — r, to w trakcie ostatniego kroku nastąpiło wycofanie r 
elementów będących instancją wzorca p. Z ostatniego elementu Z jesteśmy 
w stanie odtworzyć stukturę tej instancji, tzn. długości ly,...,ly ciągów pod- 
stawionych pod kolejne zmienne. Następnie analizując P jesteśmy w stanie 
stwierdzić ile luk zawierała instancja oraz w których miejscach wycofanego 
fragmentu sie one znajdowały, natomiast z © i H jesteśmy w stanie odtwo- 
rzyć konkretne litery, które były podstawione pod zmienne. Połączenie tych 
kroków pozwala na zrekonstuowanie słowa sprzed retrakcji wykonanej przez 
algorytm w ostatnim kroku. Przypisanie zrekonstruowanego słowa do F” oraz 
odpowiednie skrócenie P’, L’, S" oraz H' daje nam porządaną piątkę odpo- 
wiadającą (M — 1)-emu krokowi algorytmu. 


Kompresja. Interesować nas będzie asymptotyczna ilość piątek P, L, S, H, F, 
gdy M dąży do nieskończoności. Podamy wspólne ograniczenie na ilość trójek 


P, L, S i osobne ograniczenia na H i F. 


16 


Ograniczenie liczby trójek (P, L, S). Zastosujemy opisane wcześniej me- 
tody analityczne do ograniczenia rzędu wykładniczego ciągu (Ty)nen trójek 
(P, L, S), które możliwe są do uzyskania po n krokach algorytmu. Na potrzeby 
szacowania dokonamy dwóch niewpływających na asymptotykę modyfikacji 
trójek P, L, S: 


1. Dla każdej trójki przedłużmy P w taki sposób, by kończyła się słowem 
pustym, tj. by pn = 0. Ze względu na ograniczoną ilość możliwych 


wartości p; da się to zrobić dopisując jedynie stałą liczbę elementów, 
2. Na poczatku ciągu P dodamy dodatkowy wyraz o wartości 1. 


W ten sposób uzyskamy ciągi P, których sumy pozątkowe nigdy nie osią- 
gają wartości 0 oraz których całkowita suma wynosi 1. Zbiór takich ciągów 
nazwijmy Pı. Zauważmy, że konsekwencją tych własności jest to, że P € Pı 
jest albo długości 1, albo w ostatnim kroku następuje spadek (czyli p, < 0). 
Podążając za ideą dekompozycji ostatnich spadków [10, rozdział V.4], udo- 


wodnimy teraz: 


Fakt 2.5. Funkcja tworząca zliczającega obiekty w P; spełnia równanie 


Pı(z) =2(1+ 1 =): 


Dowód. Niech P będzie ciągiem z Pı o długości n i ostatnim spadku wyso- 
kości d. Ponadto niech i, będzie ostatnim indeksem, dla którego X! p; = h 
oraz niech ig = 0. Wtedy P, zdefiniujemy jako [p;,_,41,.-.,p;,|. Zauważmy 
teraz, że wszystkie ciągi P, należą również do Pı i po konkatenacji tworzą 
pierwsze n — 1 wyrazów ciągu P, zatem po skonkatenowaniu z jednowyrazo- 
wym ciągiem |1— d] tworzą całe P. Ze względu na jednoznaczność rozkładu na 
P, oraz jednowyrazowy ciąg daje nam to równanie rekurencyjne dla funkcji 


tworzącej: 
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Pı(z) = -(SEQ(Pi(2))) = (1-50) = (1 + rz): (1) 


Niech PL, oznacza zbiór par (P, L), gdzie P € Pı oraz L € L. Teraz by 
uzyskać funkcję tworzącą zliczającą takie pary należy zdefiniować funkcję, 
która poza opisem ciągów P wraz z każdym spadkiem będzie zapisywać rów- 
nież odpowiedni jego podział na k części (gdzie k to ilość różnych zmiennych 


we wzorcu): 


Fakt 2.6. Funkcja tworząca zliczającega obiekty w PL, spełnia równanie 


PLi(z) = -(1 | I; PEJA) 


gdzie u; jest ilością wystąpień i-tej zmiennej we wzorcu. 


Dowód. Niech P, L będzie parą z PL+, gdzie P jest długości n i ma ostatni 
spadek wysokości d. Dekompozycja opisująca PL; będzie podobnej postaci 
jak (1), jednak by dodatkowo opisać podział ostatniego spadku, należy po- 
dzielić składowe P, na k kolejnych podzbiorów, z których każdy jest wielkości 
sumarycznej ilości liter przyporządkowanych do wszystkich wystąpień odpo- 
wiadającej mu zmiennej. Należy zwrócić uwagę na fakt, że ta wartość będzie 
podzielna przez ilość wystąpień zmiennej odpowiadającej danemu podzbio- 
rowi w całym wzorcu. Wszystkie spadki w P nie licząc ostatniego są opisane 
poprzez inne elementy (P, L), zatem ich podział nie musi być dodatkowo opi- 
sywany w dekompozycji. Konstrukcję taką można uzyskać za pomocą opera- 
tora SEQ;: 


PLı(z) - :(1+11seo(seQ, (PLı(z) )) - (4 Th er) (2) 


i=l i= 


= 
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Niech teraz T będzie zbiorem trójek P, L, S takich, że P € P,, L € L oraz 
S € S. By uzyskać funkcję tworzącą zliczającą elementy T należy powyższe 
konstrukcje uzupełnić tak, by zapisywały dodatkowo wszystkie zapisywane 


litery: 


Fakt 2.7. Funkcja tworząca zliczającega obiekty w T spełnia równanie 


T(z) =2(1 II 1 u) 


i=l 


gdzie u; jest ilością wystąpień i-tej zmiennej we wzorcu. 


Dowód. Niech P, L, S będzie trójką z T, gdzie P jest długości n i ma ostatni 
spadek wysokości d. Dekompozycja opisująca T będzie podobnej postaci jak 
2, jednak dodatkowo będzie zapisywać wycofane litery. Można to osiągnąć do- 
pisujac po prostu wartość 3 przed symbolem SEQ,, co jest równoważne skoja- 
rzeniu wartości 3 z każdym wystąpieniem 7(z)*% po prawej stronie równania. 
Konstrukcja taka odpowiada zapisywaniu tylu liter, ile w ostatnim spadku 
zostało przyporządkowanych do wszystkich zmiennych (zliczając tylko poje- 


dyncze wystąpienia każdej z nich): 


AO (141 (SEo(3:sPQ,(7)))) 2 (1 | II - HO) (3) 


i=1 


Funkcja ¢(t) = 1+ Guz E3) spełnia warunki twierdzenia 1.4, a zatem 


istnieje jednoznaczne rozwiązanie 7 € (0, R) równania eo = 1, gdzie R jest 
promieniem zbieżności 6. Zdefiniujmy w(x) = 30 i zauważmy, że 
pay- 2O -2 Pe 1 _ zre) 
p(x) olz) p(x) 


Zatem mamy następujące równoważności między równaniami: 
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1 _ g(a) 
dla) (z) 
T 

5) = 


T 
pa) (B) 


Zauważając ponadto, że v(0) = O oraz że w przyjmuje wartości nieujemne 


w obrębie promienia zbieżności dochodzimy do wniosku, że rozwiązanie rów- 
nania (5) jest maksimum funkcji Y w tym obszarze. Jako ze na mocy twier- 
dzenia 1.4 interesująca nas asymptotyka [2”|7(ż) jest wykładniczego rzędu 
(3). gdzie p = 25 = p(T), by otrzymać górne oszacowanie na wykładni- 
czy rząd asymptotyczny współczynników rozwinięcia 7 , wystarczy nam teraz 
oszacować od dołu maksimum v(t). Jako że interesuje nas tylko oszacowanie, 
zawęzimy się w naszych rozważaniach do 0 < t < 0.5, co pozwoli uniknąć pro- 
blemów z zależnością mniędzy promieniem zbieżności 7 (a zatem i dziedziną 
w), a parametrami k i l;, gdyż promień zbieżności w interesującym nas pod- 
zbiorze możliwych parametrów jest zawsze większy od 0.5, więc rozważane 
funkcje będą ściśle dodatnie i określone w całej dziedzinie. Znajdziemy naj- 
pierw takie parametry k oraz l;, dla których maksimum % jest najmniejsze. 


Najpierw znajdziemy odpowiednie /, przy ustalonym k: 


Fakt 2.8. Niech 0 < t < 0.5. Wtedy funkcja 
t 


EM (Th (r) 


o dziedzinie równej L = fh, TEN E Oe KĘ a przyjmuje minimum 


Well, -- lx) 


w jednym z punktów ekstremalnych dziedziny, tj. gdy wszystkie l, są równe 2 


z wyjątkiem co najwyżej jednego. 
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Dowód. Niech lm ui oraz niech t > 0. Z wypukłości funkcji wykładniczej 


wynika wtedy sio ciąg równoważności: 
a > pm 


t 


1-30 — 3t + tlt < 1 — 6t™ + 9t” 


t 


eas oe 
1+C 21+C 
(1 — 3tle)(1 — 3t) * (1 — 3tlm)(1 — 3t) 
T 
t e t 
gęla tlo N git! 
14 rennen 14 C Gaim) =a) 


t t 
3tla 3t!b 3tlm tlm 
tC (1-3tla) es FC (1-3t!m) (1-3tlm) 


dla dowolnej stałej C. Ustalając C równe iloczynowi dla wszystkich 


(1- 505 
pozostałych l; dostajemy wklęsłość funkcji 44. Funkcja wklęsła na zbiorze 


wypukłym, jakim jest ustalona dziedzina l;, przyjmuje minimum w jednym 


z punktów ekstremalnych tego zbioru, co daje tezę. 


Znając teraz zależność między wartościami |; oraz k jesteśmy w stanie wybrać 


odpowiednie k: 


Fakt 2.9. Niech 0 < t < 0.5. Wtedy 
t 


k—1 k 
1 4 312 312 —2k+2 
1-3t? 1312 —2k+2 


jest funkcją ściśle rosnąca dla 0 < t < 0.5 oraz k naturalnego wiekszego od 2. 


QE 
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ext 


Dowód. Fakt ten można udowodnić licząc pochodną funkcji wf""(k) i spraw- 
dzając jej dodatniość, jednak postać pochodnej jest tak skomplikowana, że 
unikamy tego podejścia kierując się klarownością wywodu. Przeanalizujmy 
wpływ zwiększenia k o jeden na wartość funkcji. Rozważymy go poprzez 
analizę trzech termów, w których występuje k: EMO BE 25) 


Oraz a (3): 


(1) a < 3, zatem pierwszy term zwiększy się najwyżej trzykrotnie, 


425tl —2(kṢ 


(2) AE ROI = t?*-?, zatem drugi term zmaleje przynajmniej 32-krotnie, 


(3) 1 < gran < 15 dla każdego k, zatem trzeci term wzrośnie najwyżej 


16 . 
ą5-krotnie. 


Z powyższej analizy jasno wynika, ze mianownik v;”'(k) jest funkcją male- 


ext 


jaca, a zatem v;”'(k) jest rosnąca. 


Z faktów 2.8 i 2.9 wynika, że najmniejsze maksimum funkcja % przyjmuje 


dla parametrów k = 3 oraz lı = 2, ly = 2,13 = 4. Używając programu Maple 
dokonujemy sprawdzenia (stosując obliczenia symboliczne), że dla takich pa- 
rametrów osiąga ona wartość większą niż 0.487 dla z = 0.471, a zatem rząd 
wykładniczy T, jest nie większy niż 1/0.4710 = 2.1229 i w konsekwencji ist- 
nieje najwyżej 2.1229” trójek P, L, S możliwych do uzyskania w M krokach 
algorytmu 1. 


Ograniczenie liczby elementów H. Każda retrakcja R wycofuje co naj- 
mniej 8 liter, a zatem dodaje co najwyżej Ki liter do H. Ponadto suma 
długości wszystkich retrakcji jest niewiększa niż M, a zatem istnieje najwyżej 


28 < 1.1M ciągów R możliwych do osiągnięcia po M krokach algorytmu. 


Ograniczanie liczby elementów F. Ostateczna sekwencja liter jest dłu- 


gości najwyżej |W| — 1, zatem istnieje najwyżej 4'"| takich sekwencji, bo do 
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każdego miejsca może zostać przyporządkowany jeden z symboli 0, 1, 2 (litery 
alfabetu ternarnego) lub brak symbolu. Symbole © mogą być przyporządko- 
wywane tylko do ustalonych wcześniej pozycji, zatem dodatkowe zapisywanie 


ich nie jest konieczne. 


Ograniczanie liczby piątek (P, L, S, R, F). Mnożąc wszystkie poprzednie 
ograniczenia dla dostatecznie dużego M otrzymujemy ograniczenie (2.1229 x 
1.1)” x 4W! < 2.34M x 4IWI < 3M na wszystkie możliwe piątki w pełni opi- 


sujące wszystkie 3” możliwych prefiksów C, co daje nam pożądaną sprzecz- 


ność. 


2.4 Uwagi końcowe 


Algorytmiczny Lokalny Lemat Lovásza jest bardzo użyteczną metodą w dzie- 
dzinie unikania wzorców w słowach, jednak jego siła przejawia się głównie w 
zachowaniach asymptotycznych (można to zresztą powiedzieć o większości 
metod o naturze probabilitycznej). Bezpośrednie zastosowanie technik wyko- 
rzystanych w dowodzie dla alfabetów ternarnych pozwala na udowodnienie 
hipotezy o alfabetach binarnych dla wzorców p o conajmniej 3 zmiennych. Z 
tego wzgledu pełny dowód hipotezy dla alfabetów binarnych może wymagać 


innych metod. 


3 Unikanie wzorców w grafach 


3.1 Podstawowe definicje 


Dla grafu G przez V (G) i E(G) oznaczać będziemy odpowiednio zbiór wierz- 
chołków i krawedzi G. Dekompozycja drzewowa grafu G to graf T będący 


drzewem (grafem spójnym nieposiadający cyklu) o wierzchołkach Xj,..., Xn, 
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gdzie każde X; jest podzbiorem wierzchołków grafu G spełniającym nastę- 


pujące warunki: 
1. Każdy wierzchołek grafu G należy do przynajmniej jednego X;. 


2. Jeśli ve V(G) należy zarówno do X; jak i X,;, to wszystkie wierz- 
chołki X, € V(T) leżące na (jedynej) ścieżce między X; a X; również 


zawierają v. 


3. Dla każdej krawędzi (v,w) € E(G) istnieje X, zawierający zarówno v 


jak i w. 


Analogicznie dekompozycja ścieżkową będziemy nazywać graf P będący 
ścieżką o wierzchołkach X;,..., Xn spełniających powyższe warunki. Dla 
ustalonej dekompozycji (drzewowej lub ścieżkowej) przez jej szerokość ro- 
zumieć będziemy rozmiar największego zbioru X;. Minimalną możliwą sze- 
rokość dekompozycji drzewowej grafu G nazywać będziemy szerokością drze- 
wową G, natomiast minimalną szerokość dekompozycji ścieżkowej G - jego 
szerokością ścieżkową. 

Kolorowanie grafu to funkcja $ : V(G) — N przyporządkowująca każ- 
demu z wierzchołków kolor będący liczbą naturalną, natomiast k-kolorowanie 
to kolorowanie używające jedynie k kolorów. Powiemy, że kolorowanie 6 : 
V(G) — N grafu G unika wzorca p, jeśli nie istnieje w nim ścieżka prosta, 
która zawierałaby p (rozważamy kolory wierzchołków na ścieżce jako litery al- 
fabetu k-arnego). W szczególności, kolorowanie jest nierepetytywne jeśli unika 
wzorca AA. Liczba Thuego grafu G, oznaczana jako 7(G), to minimalna liczba 
kolorów k, dla której da się skonstruować nierepetytywne k-kolorowanie G. 

Przyporzadkujmy teraz każdemu z wierzchołków v liste L, C N do- 
stępnych kolorów. Kolorowanie G z list to takie kolorowanie, dla którego 


Vuev(ajo(v) € Ly. Listowa liczba Thuego grafu G, oznaczana jako 7(G), 
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to minimalne k takie, że dla każdego przyporządkowania list wielkości k do 
wierzchołków G istnieje nierepetytywne kolorowanie z tych list. 

W obrębie tego rozdziału interesować nas będzie czasem wybieranie mniej- 
szej listy z większych list kolorów dostępnych dla każdego wierzchołka - na 
taką procedurę patrzeć będziemy jak na wybór podlisty ze wszystkich moż- 
liwych podlist i nazywać prekolorowaniem. O prekolorowaniu powiemy, że 
unika wzorca p, jeśli z wybranych list nie da się wybrać kolorów tak, by 


powstała instancja wzorca. 


3.2 Wprowadzenie 


Jednym z naturalnych rozwinięć tematyki unikania wzorców w słowach nad 
alfabetem k-arnym jest unikanie wzorców w grafach kolorowanych k kolorami. 
Problem ten był rozważany głównie w kontekście unikania powtórzeń (tzn. 
wzorców typu AA) i ograniczania liczby kolorów ze względu na różne para- 
metry grafowe. Wynikiem, który zapoczątkował badania w tej dziedzinie było 


ograniczenie ilości kolorów ze względu na maksymalny stopień wierzchołka 
[1]: 
Twierdzenie 3.1. Istnieje stata c taka, że 
T(G) <m(G) < cA? 
dla wszystkich grafów o maksymalnym stopniu wierzchołka równym A. 


Ponadto w tej samej pracy udało się pokazać, że istnieją grafy, dla których 
n(G) > maż Dzięki późniejszym pracom dotyczącym oszacowania stałej c 
[13, 14, 15, 7] zostało osiągnięte oszacowanie n(G) < m(G) < (1 + 0(1))A? 
[7]. Wszystkie te wyniki w naturalny sposób uogólniają sie na listową liczbę 
Thuego. 

Jednym z prostszych wyników w tej dziedzinie jest ograniczenie liczby 


Thuego dla wszystkich drzew przez 4 [1], które zostało uogólnione dla wszyst- 
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kich grafów o ograniczonej szerokości drzewowej przez Kiindgena i Pelsma- 
jera. Pokazali oni, że 7(G) < 4* dla wszystkich grafów o szerokości drzewowej 
k [16]. Jeśli zamiast szerokości drzewowej rozważy się szerokość ścieżkową, 
znane jest ograniczenie wielomianowe: 7(G) < 2k? + 6k +1 [7]. 

Przejdziemy teraz do omówienia wyników dotyczących listowej liczby 
Thuego, która będzie głównym tematem tego rozdziału. Wiadomo, że dla 
ścieżek listowa liczba Thuego wynosi 3 lub 4 i jest to jeden z pierwszych wy- 
ników wykorzystujących algorytmiczną wersję Lokalnego Lematu Loväsza w 
problematyce unikania wzorców [12] (zwykła liczba Thuego dla ścieżek wy- 
nosi 3 i jest to prosta konsekwencja twierdzenia Thuego). Niedawny wynik 
Fiorenzi ego, Ochema, Ossona de Mendeza i Zhu jest pierwszym wskazują- 
cym na różnicę między listową i klasyczna liczbą Thuego [11]. Pokazali oni, 
że listowa liczba Thuego dla drzew nie jest ograniczona. Oczywiście drzewa, 
które osiągają wysoką listową liczbę Thuego muszą mieć również wysokie 
stopnie wierzchołków, co wynika z przytoczonego wcześniej ograniczenia. 

Z jednej strony wiemy więc, że 7(G) nie jest ograniczone dla grafów 
z ograniczoną szerokością drzewową, z drugiej strony jest ograniczone dla 
ścieżek i grafów z szerokością ścieżkową 1 [7]. Dwa wyniki, które zaprezen- 
tuję w tym rozdziale powstały we współpracy z Piotrem Mickiem, Jakubem 
Kozikiem oraz Gwenaćlem Joretem. Pierwszy z nich to konstrukcja kontr- 
przykładu pokazującego, że listowa liczba Thuego nie jest ograniczona dla 
grafów z organiczoną szerokością ścieżkową: 


sot fie 


2 taki, ze n,(G) > c. 


W obliczu tego wyniku i prostego ograniczenia klasycznej liczby Thuego 
dla drzew zasadnym wydaje się pytanie o listową liczbę Thuego dla drzew 
z ograniczoną szerokością ścieżkową (ograniczenie to nie ogranicza stopni 
wierzchołków). Drugi wynik jest pozytywny i stanowi ograniczenie na liczbę 


kolorów w tej właśnie konfiguracji: 


26 


Twierdzenie 3.3. Istnieje funkcja f : N — N taka, że n,(T) < f(k) dla 


każdego drzewa T o szerokości ścieżkowej k. 


3.3 Ogólne grafy o ograniczonej szerokości Sciezkowe] 


Sekcję tę zaczniemy od konstrukcji grafu o szerokości ścieżkowej 2 i dowolnie 
dużej listowej liczbie Thuego. Niech D,,;, będzie grafem powstałym ze ścieżki 
o długości 2n poprzez zastąpienie każdego nieparzystego wierzchołka grupą 


(© wierzchołków, to jest: 


V(Doa) = (ual € nl) U taż, „lie ha € (p I 


Wierzchołki są połączone krawędzia w Dy wtedy i tylko wtedy, gdy ich 
indeksy dolne różnią się o dokładnie jeden (co w szczególności oznacza, że 
grupy wierzchołków nieparzystych tworzą zbiory niezależne). Udowodnimy 


teraz, że: 


Twierdzenie 3.4. Jeśli k in są liczbami naturalnymi takimi, zek > 1 4 
n > et? to mi Di > k. 


Dowód. Na potrzeby dowodu wierzchołkiem uogólnionym V; nazwijmy wierz- 
chołek v; dla i parzystych oraz zbiór wszystkich wierzchołków v; ; dla 7 nie- 
parzystych. Wtedy dla kolorowania 6, przez ¢(2i + 1) będziemy rozumieć 
zbiór wszystkich kolorów wybranych dla wierzchołków w Va,+1. Przyporzad- 
kujmy listy długości k do wierzchołków w taki sposób, że wierzchołki parzyste 
otrzymają parami rozłączne listy, natomiast wierzchołki nieparzyste o danym 
indeksie otrzymają wszystkie możliwe listy kolorów używanych przez listy 
wierzchołków parzystych. Dla wierzchołka v;, gdzie i = 2ł połóżmy zatem 
Li = {tk+1,tk+2,...,tk+k}, a dla wierzchołków voi411, Voi41,2;---; Vyjr (kn) 


niech Loj411,... będą wszystkimi k-elementowymi podzbiorami {1,2,..., kn}. 
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Przypuśćmy teraz, ze dla takiego doboru list @ jest nierepetytywnym 
k-kolorowaniem Dn,- By dojść do sprzeczności wystarczy rozważyć powtó- 
rzenia bloków nieparzystej długości. Zauważmy, że dla każdego segmentu 
[D;, D; 4; 2] musi istnieć parzyste I takie, że $(l) € ó(1+25 +1) dla pewnego 


j € Z. Powiemy wtedy, ze para (l,l + 27 + 1) jest świadkiem dla segmentu 


[D;, Di+4j+2]. Oczywiście każdy segment musi mieć świadka, ponadto para 


(1,1 + 27 + 1) może być świadkiem jedynie dla zawierających ją segmentów 
długości 4j + 2, a zatem dla najwyżej |2j + 1| segmentów. 


Graf D, x zawiera n — (4l + 1) segmentów długości 4l + 2, które w sumie 


n— (411) — n+ 
2l+ | = Er 


po wszystkich / otrzymujemy nierówność prawdziwą dla odpowiednio dużych 


potrzebują co najmniej | - — 2] różnych świadków. Sumując 


n: 


p RR. l n n n, n n, M 
EN b te 


Zauważmy teraz, że uogólniony wierzchołek nieparzysty Vo; ,1 może nale- 


nN 2 
2] > 558, 


żeć do najwyżej k—1 par typu (/,24+1) będących świadkami, gdyż nalezenie 
do każdej z nich wiąże się z niemożliwością wykorzystania koloru o(l) w żad- 
nym z wierzchołków Vo,,1. Jeśli więc należałby on do k par, zabraniałyby 
one k różnych kolorów, zatem wierzchołek V2;,; odpowiadający zabronionej 
k-tce nie mógłby zostać pokolorowany. Z równania 6 wynika, że uogólniony 
wierzchołek nieparzysty należy średnio do 3 In(#) par będących świadkami, 


k+2 


co w połączeniu z założeniem n > e*** daje nam pożądaną sprzeczność. 


3.4 Drzewa o ograniczonej szerokości Śścieżkowej 


Reszta niniejszego rozdziału poświęcona będzie dowodowi twierdzenia o ogra- 
niczonej listowej liczbie chromatycznej drzew z ograniczoną szerokością ścież- 


kową. W całym dowodzie utrzymywana będzie konwencja, wedle której ko- 


28 


rzeń drzewa jest jego najniższym wierzchołkiem, a liście - najwyższymi. Me- 


toda będzie bardzo podobna do wykorzystanej w dowodzie twierdzenia 2.4: 


Twierdzenie 3.5. Istnieje funkcja f taka, że jeśli T jest drzewem o szero- 


kości ścieżkowej w to m(T) < f(w). 


Ze względów technicznych zanim przejdziemy do dowodu uogólnimy po- 
jęcie powtórzenia. Powtórzeniem długości n ż przerwą t nazywać będziemy 
ciąg (@1,...,@n,b1,.-., bt, Qn41,---;@an), gdzie a; = Ain. Powtórzenie długo- 
ści k nazywać będziemy w skrócie k-powtórzeniem. Nadużywając lekko nota- 
cji ścieżkę w grafie, w którym sekwencja kolorów tworzyć będzie powtórzenie 
również nazywać będziemy powtórzeniem. Środkową krawędzią powtórzenia 
długości k nazwiemy krawędź pomiędzy k-tym, a k + 1-szym wierzchołkiem 
ścieżki. Bliźniakiem l-tego wierzchołka w powtórzeniu długości k nazwiemy 
wierzchołek o indeksie (l + k) mod 2k. 

W dowodzie korzystać będziemy z następującego lematu o dekompozycji 


OPEK 


drzew o ograniczonej szerokości ścieżkowej: 


sot fie 


P roztacznych ścieżek należących do T taki, że: 


1. Kazdy wierzchołek T należy do dokładnie jednej ścieżki w P, 


2. Metadrzewo T powstałe zT przez kontrakcję wszystkich ścieżek w P ma 


średnicę nie większą niż art} — 1. 


Dowód. Dowód będzie przebiegać indukcyjnie ze względu na k. Przypadek 
k = 0 jest oczywisty, załóżmy więc, że k > 0 i teza zachodzi dla wszystkich 
l< k. Każdy graf o szerokości ścieżkowej k jest spójnym podgrafem grafu 
przedziałowego o wysokości k + 1, weźmy więc dowolną reprezentację takiego 
nadgrafu dla T. Niech P) będzie ścieżką łączącą przedział zaczynający się 
najbardziej na lewo w tej reprezentacji z przedziałem kończącym się najbar- 


dziej na prawo (jest ona wyznaczona jednoznacznie, bo T jest drzewem). Po 
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usunięciu Pp z reprezentacji, pozostaje las o szerokości ścieżkowej nie większej 
niż k — 1. Z założenia indukcyjnego każde pozostałe drzewo posiada dekom- 
pozycję na ścieżki spełniające warunki twierdzenia tworzące metadrzewa o 
szerokości nie większej niż 2" — 1. Niech P będzie sumą tych ścieżek i Pp. 


Oczywiście ścieżki P są podziałem wierzchołków drzewa T’, a średnica meta- 


drzewa P jest nie większa niż 25"! — 1. 


Ustalmy teraz drzewo T o szerokości Sciezkowej k wraz z dowolnym zanu- 
rzeniem na płaszczyznę, korzeniem oraz dekompozycją P o metadrzewie T. 
Dodatkowo skierujmy każdą ścieżkę w P w prawą stronę. Pojedynczą ścieżkę 
dekompozycji nazywać będziemy ścieżką pierwotną, natomiast jej wierzcho- 
tek sąsiadujący ze ścieżką bliższą korzeniowi T - punktem centralnym (oczy- 
wiście ścieżka zawierająca korzeń nie ma punktu centralnego). Dla każdego 
wierzchołka v € T, poziomem v będziemy nazywać odległość metawierzchołka 
zawierającego v do metawierzchołka zawierającego korzeń T w metadrzewie 
T. Dla dowolnej ścieżki w T, jej fragment składający się z wierzchołków na 
najniższym osiąganym przez nią poziomie nazywać będziemy dolną częścią 
ścieżki. Scieżkę w T nazywać będziemy stabilną jeśli oba z jej końców sa 
w jej dolnej części, jednokierunkową - jeśli leży tam tylko jeden z końców, 
oraz dwukierunkową - jeśli żaden z końców nie leży w dolnej części ścieżki. 
Jednokierunkowa ścieżka (v;,...,v,) jest skierowana w lewo jeśli (va, v1) jest 
skierowaną krawędzią w ścieżce P zawierającej vı, w przeciwnym wypadku 
taka ścieżka jest skierowana w prawo (nawet jeśli vı i v2 należą do różnych 
ścieżek w P, definicje nie są zatem w pełni symetryczne). Dla ścieżek jedno- 
i dwukierunkowych wierzchołki należące do dolnej części ścieżki mające są- 
siada nienależącego do dolnej częśći nazywać będziemy punktami załamania. 
Dla punktu v na poziomie k, dziećmi tego punktu nazwiemy wszystkie wierz- 
chołki z poziomu k+ 1, które sąsiadują z v. Przez vt oznaczać będziemy sumę 
wszystkich potomków v wraz z v. 


Zanim przejdziemy do konstrukcji nierepetytywnego kolorowania T skró- 
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cimy listy wykluczając jednocześnie następujące szczególne typy powtórzeń: 


(1) k-powtórzenia z przerwą t, gdzie t < k, należące w całości do jednej 


ścieżki pierwotnej, 


(2) jednostronne k-powtórzenia skierowane w prawo z dowolnie dużą prze- 
rwą takie, że przecięcie przerwy i dolnej części powtórzenia jest nie 


dłuższe niż k, 


(3) jednostronne k-powtórzenia skierowane w lewo z dowolnie dużą przerwą 
takie, że przecięcie przerwy i dolnej części powtórzenia jest nie dłuższe 


niż k. 


Opis stopniowego skracania list opiszemy w trzech lematach poświęconych 
trzem kolejnym typom powtórzeń. Skracanie list w drzewie można rozważać 
jako kolorowanie drzewa krótszymi listami, każde takie kolorowanie nazywać 
będziemy L-kolorowaniem. We wszystkich dowodach wszystkie skrócone listy 
będą tej samej długości. Ścieżkę pokolorowaną listami nazywać będziemy L- 
powtórzeniem danego typu, jeśli z list da się wybrać kolory w taki sposób, 
by powstało powtórzenie tego typu. 

Ze względów technicznych będziemy potrzebować następującej obserwa- 


cji: 


Lemat 3.7. Jeśli x1,...,x, jest ciągiem nieujemnych liczby rzeczywistych 
takich, że ZR +2; = M to II? „z, < 4™. 


Dowód. Z nierówności Cauchy'ego wynika, że iloczyn n liczb o stałej sumie 
jest maksymalizowany, gdy liczby te są równe. Interesuje nas zatem mak- 


symalna wartość wyrażenia x” przy założeniu, że nx = M. Zauważmy, że 


dla x > 4 mamy (5)” > x, a zatem wybranie x = $ in’ = 2n zwiększy 


nasze wyrażenie. Maksimum jest więc osiągane dla 1-ów mniejszych niż 4, co 


implikuje nierówność z” < 4" < 4M. 
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10 


11 


OR KO 


Lemat 3.8. Jeśli T jest drzewem o szerokości ścieżkowej k z listami wiel- 
kości N = 64n? + n — 1 przyporządkowaymi do wierzchołków to istnieje L- 
kolorowanie T listami wielkości n w taki sposób, by nie istniało L-powtörzenie 


typu (1). 


Dowód. Niech T będzie drzewem o szerokości drzewowej k, metadrzewie T i 
ze zbiorem list {L,},ever) 0 wielkościach równych 64n* + n— 1 dla każdego v. 
Załóżmy, że nie jest możliwy wybór podlist wielkości n w taki sposób, by nie 
istniała L-powtörzenie typu (1). Z definicji każde powtórzenie typu (1) za- 
warte jest w jednej ścieżce pierwotnej, a zatem istnieje pewna ścieżka P € P, 
dla której nie istnieje odpowiedni wybór podlist. Rozważmy randomizowany 
algorytm (Algorytm 2 poniżej) próbujący wybrać podlisty w taki sposób, by 


nie stworzyć L-powtórzeń typu (1). 


Algorithm 2: Unikanie powtórzeń typu (1) 
wejście: S : N — (9) 
i= l,j=1,C-f 
while Scieżka nie jest w całości L-pokolorowana do 
C(v;) — podlista L o indeksie S(i) 
i++ 
j++ 
if Istnieje instancja R L-powtörzenia kończąca się na v; then 
Niech Wr będzie powtórzoną częścią R zawierającą v; 
for ve Wr do 


usuń warotść C(v) 


j — indeks pierwszej pozycji w Wr 


return C 


Zauważmy, ze dzięki założeniu o nieistnieniu poprawnego L-kolorowania, 


algorytm nigdy się nie zatrzyma. Ustalmy teraz pewną sekwencję wejściową 
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S i prześledźmy pierwsze M kroków działania algorytmu. Tak jak poprzed- 
nio, postaramy się opisać działanie algorytmu za pomocą struktur, których 
ilość oszacujemy później za pomocą metod kombinatoryki analitycznej. Tym 


razem strukturą będzie czwórka (P, F,G, R), gdzie: 


e P = (p,..., pm) jest ciągiem liczb, gdzie p; jest jest ilością wierzchoł- 


ków z nadanymi kolorami (mniejszymi listami) po i krokach, 
e F jest funkcją częściową C po M krokach algorytmu, 


e G=(gi,...,g.) jest ciągiem liczb takich, że g; jest długością przerwy 


w i-tej wycofanego powtórzenia typu (1), 


e R = (rı,...,r,) jest ciągiem sekwencji liczb, gdzie r; = (4,...,lk) 
odpowiada 7-temu powtórzeniu. Jeśli i-te powtórzenie pojawiło się na 
ścieżce (v1,..., Uk, 01,--- „Dy, Uką1;---, Vo), gdzie t jest długością prze- 
rwy, a listy je tworzące to Lı,..., Ly, By,..., By, Lg, - - - , Lok to l; jest 
indeksem listy 44; spośród wszystkich list możliwych do wybrania na 


wierzchołku v;. 


Teraz przystąpimy do dowodów kompresji i bezstratności tego kodowania, 


analogicznie jak miało to miejsce w poprzednim rozdziale. 


Kompresja 
1. Zacznijmy od oszacowania ilości wszystkich możliwych P. Ciąg (p1,..., Dar) 
bijektywnie przetransformujmy w ciąg różnic (1,p2—pP1,...,PM-PM-1) 


tak, że wszystkie różnice należeć będą do zbioru 41,0, —1, —2,... |. Na- 
stępnie każdy niedodatni element —k tego ciągu zamieńmy w podciąg 
(1,—1,—1,...) długości k, łatwo sprawdzić, że ta operacja również jest 
bijektywna. Ciąg wynikowy jest ciągiem zerojedynkowym o długości 
nie większej niż 2M, zatem ilość takich ciągów jest rzędu O(4™), więc i 


ilość P jest takiego rzędu, jako że obie transformacje były bijektywne. 
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2. Liczba możliwych F może być traktowana jak stała, gdyż nie rośnie 


wraz z M. 


3. Suma elementów G jest nie większa niż suma długości wszystkich wy- 
cofanych L-powtórzeń, która jest nie większa niż M, zatem ilość możli- 
wych ciągów G jest mniejsza niż ilość ciągów M + 1 liczb nieujemnych 
sumujących się do M, czyli (u) = O(4™). 


4. By oszacować liczbę możliwych R przypomnijmy, że każde l; wystę- 
pujące w r; bedącym elementem R jest indeksem pewnej n-podlisty 
pośród wszystkich n-podlist listy rozmiaru N mających niepuste prze- 
cięcie z pewną jej ustaloną podlistą rozmiaru n. Indeks ten nie może być 
większy niż Ba. Suma długości sekwencji składających się na R jest 
nie większa niż M, a każdy ciąg długości M może być rozdzielony na 


2M-1 sposobów. Aby zakodować R należy osobno 


spójne podciągi na 
zakodować wyrazy należące do wszystkich sekwencji oraz sposób po- 
działu na sekwencje, co w połączeniu z poprzednimi obserwacjami daje 


pożądane oszacowanie postaci G(żn( 1). 


n-l 


Mnożąc uzyskane szacowania dostajemy oszacowanie na ilość możliwych czwó- 


rek (P, F,G, R) opisujących konkretny przebieg algorytmu o długości M: 


oe") or)" 


Widać zatem, że dla wystarczająco dużego M liczba możliwych opisów dzia- 
łania algorytmu jest mniejsza niż liczba początkowych segmentów S o dłu- 
gości M. By uzyskać sprzeczność wystarczy teraz pokazać, że dwa różne 


segmenty początkowe S generują zawsze różne opisy. 


Bezstratność opisu 
Udowodnimy, że da się zrekonstruować pierwsze M elementów ciągu S na 


podstawie czwórki (P, F, G, R) powstałej po M krokach działania algorytmu. 
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Argument będzie iteracyjny - dla (P,F,G,R) zrekonstruujemy S(M) oraz 
(P', F',G’, R') - czwórkę powstałą po M — 1 krokach działania algorytmu, 
a następnie powtarzając rozumowanie - całą początkową sekwencję S. Jeśli 
pm = Pm-ı + 1 to żadne L-powtörzenie nie zostało wycofane w ostatnim 
kroku. Zatem S(M) to po prostu indeks ostatniej podlisty F, P’ i F” sa o 
jeden element krótsze, a G’ = Gi R' = R. Jeśli py = py_1—k +1, gdzie k > 
0, to w ostatnim kroku została wykonana retrakcja k elementów tworzących 
l-powtórzenie. Ostatni element G to długość luki t dla tego powtórzenia. 
Niech (a;,...,a,) będzie ostatnim elementem R, a ay1,...,@%,01,..., b: 
ostatnimi elementami F o przypisanych podlistach, oraz niech Aı,..., Az 
będą podlistami przypisanymi do a,,...,ax (informacje o tych podlistach 
są zapisane w F). Ponadto niech ayz41,...,@2, będą wierzchołkami nastę- 
pującymi po b, na ścieżce - są to wierzchołki, którym przed retrakcją były 
przypisane podlisty. Rozważmy wierzchołek ax+;. Znamy jego listę L(ag_;), 
znamy podlistę A; przypisaną do a; i wiemy, ze lista A,ıı przypisana wcze- 
śniej do ay,; ma indeks a, spośród wszystkich n-podlist L(ay,;) mających 
niepuste przecięcie z A,. Pozwala nam to zrekonstuować wszystkie podlisty 
przypisane wierzchołkom przed retrakcją - F”. Tak jak w poprzednim przy- 
padku, S(M) to indeks ostatniej podlisty F”, natomiast (P’, F’,G’, R’) są o 
jeden element krótsze niż (P, F", G, R). 


Używając bardzo podobnych argumentów w kolejnych lematach poka- 
żemy, że jeśli początkowe listy są wystarczająco długie to mogą zostać skró- 
cone w taki sposób, by każde kolorowanie unikało powtórzeń typu (2) oraz 


(3). 


Lemat 3.9. Jeśli T jest drzewem o szerokości ścieżkowej k i listach rozmiaru 
N = 64n? +n — 1 oraz bez powtórzeń typu (1) to da się wybrać podlisty roz- 
miaru n dla wszystkich wierzchołków tak, by nie istniało kolorowanie z tych 


podlist zawierające powtórzenie typu (2) o dolnej części w ścieżce pierwotnej 
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zawierającej korzeń T. 


Dowód. W obrębie dowodu powtórzenie typu (2) z dolną częścią w ścieżce 
zawierającej korzeń T nazywać będziemy powtórzeniem typu (2). Dla cze- 
ściowego L-kolorowania C i wierzchołka v niech d(C,v) będzie determini- 
stycznie skonstruowanym rozszerzeniem ČC o wszystkie wierzchołki należące 
do vf, które unika powtórzeń typu (2). Oczywiście takie rozszerzenie nie 
musi zawsze istnieć, więc d jest funkcją częściową. Jeśli istnieje wiele takich 
rozszerzeń, wybieramy pierwsze zgodnie z dowolnym ustalonym porządkiem. 
Naturalnie rozszerzamy d do funkcji, która działa na zbiorach wierzchołków, 
a nie tylko na pojedynczych wierzchołkach. 

Dowód będzie polegał na analizie algorytmu 3 kolorującego drzewo i uni- 
kającego powtórzeń typu (2). W analizie algorytmu, wartości C(v) przypo- 
rządkowane w linii 5 nazywać będziemy przyporządkowanymi bezpośrednio. 
Algorytm korzysta ze zdefiniowanej później funkcji Next oraz dodatkowych 
oznaczeń - dla wierzchołka v ze ścieżki pierwotnej P przez right(v) oznaczać 
będziemy wierzchołek na prawo od v, natomiast przez left(v) - na lewo od 
v. 

Załóżmy, że nie istnieje L-kolorowanie drzewa T unikające powtórzeń typu 
(2/). Podobnie jak w przypadku ostatniego dowodu, prześledzimy teraz pierw- 
sze M kroków algorytmu (który, znów podobnie jak w ostatnim przypadku, 
nigdy się nie zatrzyma). Zauważmy, że w każdym momencie trwania algo- 
rytmu wierzchołki pokolorowane bezpośrednio tworzą ścieżkę, a ponadto gdy 
w trakcie trwania procedury powstaje prekolorowanie typu (2’), aktualnie ko- 
lorowany wierzchołek musi być końcem ścieżki zawierającej to powtórzenie. 
Z faktu, że kolorowania poddrzew ukorzenionych w bezpośrednio pokoloro- 
wanych wierzchołkach są wybierane deterministycznie wynika ponadto, że 
częściowe kolorowanie całego drzewa jest całkowicie zdeterminowane przez 
bezpośrednio pokolorowane wierzchołki. Co więcej - i-ty wierzchołek bezpo- 


średnio pokolorowanej ścieżki (v1,... ,v,) jest zdeterminowany przez podlisty 
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1 


12 


13 


Algorithm 3: Eliminacja L-powtórzeń typu (2) 
input: $:N— (Gay 
i+ 1l1,C -f 
v — korzeń T 


while T nie jest catkowicie l-pokolorowane do 


C(v) — podlista L, długości n o indeksie S(ż) 
i++ 
if istnieje L-powtórzenie P typu (2°) then 
Niech P’ będzie powtórzoną częścią P 
for v € P'] do 
| usuń wartość C(v') 
v — punkt P’ najbliższy korzeniowi 
else 
(C,v) — Next(C,v) 
(v1,...,0;-1) (v1 jest korzeniem). 


W ogólności funkcja Next jest niezdefiniowana dla pewnych argumentów 
(np. gdy v jest pierwszym wierzchołkiem meta-ścieżki i nie ma dzieci). Mimo 
to, jako że założyliśmy niemożność pokolorowania drzewa bez powtórzeń, a 
funkcja Next zawsze wybiera poddrzewo dla którego aktualne kolorowanie 
C nie może być rozszerzone, pewne L-powtörzenie musi się pojawić przed 
osiągnięciem wierzchołka, dla którego funkcja jest niezdefiniowana. 

Przeanalizujmy pierwsze M kroków algorytmu działającego na sekwencji 
S. Informacje dotyczące przebiegu znów zapisywać będziemy jako czwórkę 
(P,F,G, R), gdzie F i R zdefiniowane będą tak jak poprzednio, w ciągu 
P=fp,...,pm) element p; oznacza ilość wierzchołków bezpośrednio po- 
kolorowanych po i krokach, natomiast G = (g1,..., g+) jest ciągiem, gdzie 


gi to ilość wierzchołków i-tego powtórzenia, które należą do przecięcia luki i 
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Algorithm 4: Funkcja Next 
1 input: C częściowe |-kolorowanie drzewa 
2 input: v wierzchołek drzewa 


3 if d(C, v) nie jest zdefiniowane then 


4 Niech (v1,..., vk) będzie numeracją dzieci v 

5 Niech j będzie największą liczbą, dla której d(C, {v1,...,v;}) 
jest zdefiniowane 

6 U EV 

7 GC — d(C, v1,..., U5) 

8 else 

9 C — d(C, v) 

10 if v jest centralnym punktem ścieżki pierwotnej P then 

11 Niech B będzie zbiorem wierzchołków na prawo od v w P 

razem z v 

12 if d(C, B) istnieje then 

13 v' — left(v) 

14 C' — d(C, B) 

15 else 

16 v — right(v) 

17 else if v jest na lewo od centralnego punktu P then 

18 v' — left(v) 

19 else if v jest na prawo od centralnego punktu P then 

20 v' — right(v) 

aa return (Cv) 


dolnej części powtórzenia. Z definicji, g, jest nie większe niż długość powtó- 
rzenia. 


Zauważmy, że wierzchołki na ścieżce będącej korzeniem meta-drzewa mogą 
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zostać pokolorowane jedynie bezpośrednio oraz że ostatni wierzchołek two- 
rzący wycofywane powtórzenie również jest kolorowany bezpośrednio, a za- 
tem każde powtórzenie składa się jedynie z wierzchołków bezpośrednio po- 
kolorowanych. 

Kompresja Przeanalizujmy asymptotyczną liczbę czwórek opisujących pierw- 
sze M kroków algorytmu, gdzie M zmierza do nieskończoności. Oszacowanie 
P, F, G oraz R jest identyczne jak w dowodzie lematu 3.9, zatem liczba moż- 


liwych czwórek wynosi: 


(Na) 


Podobnie jak poprzednio wnioskujemy zatem, ze dla wystarczająco du- 
żego M ilość możliwych opisów jest mniejsza niż ilość początkowych segmen- 
tów S, co prowadzi do sprzeczności. 

Bezstratność Znów tak jak w dowodzie poprzedniego lematu zastosujemy 
rozumowanie iteracyjne by z czwórki (P, F,G, R) otrzymać elementy ciągu 
S: 

Jeśli py = pm-ı + 1, to żadne powtórzenie nie zostało wycofane w po- 
przednim kroku. Z każdego częściowego kolorowania, w szczególności z F, 
jesteśmy w stanie wydedukować, które wartości zostały przyporządkowane 
bezpośrednio - tworzą one ścieżkę (v1,...,Um), gdzie vı jest pierwszym wierz- 
chołkiem ścieżki będącej korzeniem metadrzewa. Wtedy S(M) jest indeksem 
podlisty przyporządkowanej v„ w F, R’ = R,G’ = G, P’ to P bez ostat- 
niego elementu, natomiast F” jest częściowym kolorowaniem determinowa- 
nym przez podlisty bezpośrednio przyporządkowane (v1,...,Um—1) W F. 

Jeśli py = pm-1 — k + 1 i k > 0, to po ostatnim kroku zostało wyco- 
fane L-powtörzenie o długości k. Niech g będzie ostatnim elementem G, a 
r = (a,...,a,) - ostatnim elementem R. Zrekonstruujemy kolorowanie za- 


wierające powtórzenie w k fazach. Ścieżka z przyporządkowanymi podlistani 
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jednoznacznie wyznacza następny wierzchołek v’, któremu zostanie bezpo- 
średnio przyporządkowana podlista. Jest to również ostatni wierzchołek, któ- 
rego podlista została usunięta podczas retrakcji. Wiemy również, że podlista 
do niego przyporządkowana miała niepuste przecięcie z podlistą wierzchołka 
w należącego do drugiej powtórzenia, którego pozycję (a zatem i jego podlistę 
Aw) potrafimy odtworzyć znając g. W połączeniu z a, pozwala nam to odtwo- 
rzyć podlistę przyporządkowaną wcześniej do v’. Iterując argument k-krotnie 
otrzymujemy F”. By otrzymać F’ wystarczy usunąć ostatnio przyporząd- 


kowaną podliste F”, natomiast P’, R’ i G' równe są P, Ri G z usuniętymi 


ostatnimi elementami. 


Lemat 3.10. Dla każdego k istnieje N, takie, że jeśli T jest drzewem o 
szerokości ścieżkowej T z listami rozmiaru Ny w każdym wierzchołku bez 
powtórzeń typu (1), to możliwe jest wybranie podlist rozmiaru n, które unikać 


będą powtórzeń typu (2) i (3). 


Dowód. By pozbyć się powtórzenia typu (2) o dolnej części na danej ścieżce 
należącej do meta-drzewa wystarczy zastosować procedurę z lematu 3.9. Sto- 
sując ją dla wszystkich ścieżek pierwotnych usuniemy wszystkie tego typu 
powtórzenia. Zauważmy, że każda ścieżka pierwotna ma najwyżej k—1 przod- 
ków w drzewie, a zatem każda lista zostanie skrócona najwyżej k razy. By 


pozbyć się powtórzeń typu (3) wystarczy odwrócić kierunek wszystkich ście- 


żek pierwotnych i ponownie zastosować poprzednie rozumowanie. 


Lemat 3.11. Jeśli T jest drzewem o szerokości ścieżkowej k i listach o roz- 
miarze 2**1, które nie zawiera L-powtórzeń typów (1),(2),(3), to T może 


zostać nierepetytywnie pokolorowane. 


Dowód. Uporządkujmy wierzchołki drzewa rosnąco ze względu na odległość 
od korzenia w meta-drzewie (rozstrzygając remisy w dowolny sposób). Bę- 


dziemy kolorować wierzchołki zachłannie w taki sposób, że za każdym razem 
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gdy wierzchołkowi v będzie przyporządkowywany kolor c, kolor ten będzie 
usuwany z list wierzchołków należących do vT. Jako że głębokość skontrak- 
towanego drzewa jest mniejsza niż długość list, żadna lista nigdy nie będzie 
pusta. 

Załóżmy teraz, że w tak pokolorowanym drzewie pojawiło się powtórzenie. 
Jeśli jest ono na ścieżce jednokierunkowej, jego środkowa krawędź musi być 
na jego dolnej części (co wynika z procedury usuwania kolorów z list) - łatwo 
wtedy sprawdzić, że powtórzenie takie byłoby typu (1), (2) lub (3), co daje 
sprzeczność. 

Jako, że powtórzenia należące w całości do ścieżek pierwotnych już wy- 
kluczyliśmy, jedyną pozostającą możliwością jest powtórzenie dwustronne - 
takie, którego żaden z końców nie leży na najniższym osiąganym przez nie 
poziomie. Jednak tak jak w poprzednim przypadku, jego krawędź środkowa 
musi leżeć w jego dolnej częsci. Bez straty ogólności przyjmijmy, że krawędź 
środkowa jest nie odleglejsza od lewego punktu schodzącego, niż od prawego 


punktu schodzącego - w tej sytuacji powtórzenie typu (2) jest podścieżką 


powtórzenia dwustronnego, co daje sprzeczność. 


Tezę twierdzenia 3.5 uzyskujemy stosując lematy 3.9, 3.10 do pozbycia 
się powtórzeń typu (1), (2) oraz (3), a następnie kolorując wierzchołki drzewa 


przy pomocy lematu 3.11. 
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